<!-- Show a "Please Upgrade" box to both IE7 and IE6 users (Edit to IE 6 if you just want to show it to IE6 users) - jQuery will load the content from js/ie.html into the div -->
    
    <!--[if lte IE 7]>
        <div class="ie warning"></div>
    <![endif]-->
    
    <div id="content" role="main">
    
        <article class="post">
        
            <h2 class="entry-title"><a href="#">Bienvenido </a></h2>
             <!--[if lte IE 7]>
            <figure>
                <a href="#"><img src="images/thumbnail.jpg" alt="Post thumbnail" class="thumbnail alignleft" /></a>
            </figure>
              <![endif]-->
            <div class="entry-content">
                <p>
                    Este es un sistema de información para la extracción y limpieza de información de documentos en formato PDF, desarrollado bajo software libre con:
                 </p>
                <p>
                    » Apache, como manejador del servidor Web. 
                    <br>» PHP, como lenguaje de programación para los módulos funcionales.
                    <br>» HTML, para interfaz de usuario.
                    <br>» Pdftotext, como herramienta para la lectura del documento PDF.
                    </p>
               
                
               <hr /> <!-- Post seperator - Not the most optimal solution -->
        
        <article class="post">
        
            <h2 class="entry-title"><a href="#">Funcionamiento:</a></h2>
              <!--[if lte IE 7]>
            <figure>
                <a href="#"><img src="images/thumbnail.jpg" alt="Post thumbnail" class="thumbnail alignleft" /></a>
            </figure>
            <![endif]-->
            <div class="entry-content">
                <p>
                    En el menú de "Limpieza" se cuenta con un explorador de archivos en el que se selecciona el archivo 
                    en formato PDF del que se desea realizar la extracción, se hace click en el botón "Enviar" y se muestra
                    el resultado en el cuadro de texto.  
                </p>

                <p>
                     La limpieza se lleva a cabo suguiendo estos pasos:
                     <br>
                    <br>Paso 1: Transformar el texto completo a letras minúsculas.
                    <br>Paso 2: Eliminar caracteres especiales.
                    <br>Paso 3: Extraer las stopwords.
                </p>

                <p>
                    El el menú "Subir Documentos" se cargan los documentos en el servidor. Luego de cargarse,
                    el sistema automáticamente procede a ejecutar la limpieza sobre el documento y se crea un archivo en formato .txt que 
                    contiene el texto limpio del documento cargado. 
                </p>

                <p>
                    El el menú "Kmeans" se presenta un formulario en donde el usuario debe ingresar el número de grupos 
                    que desea formar y las palabras claves. Luego de ejecutar el algoritmo, se presenta al usuario los grupos formados, junto con el 
                    enlace de cada documento perteneciente a cada grupo. 
                </p>
            </div> <!-- .entry-content -->
        
        </article> <!-- .post 2 -->
        
         <hr /> <!-- Post seperator - Not the most optimal solution -->
         
         <article class="post">
        
            <h2 class="entry-title"><a href="#">Restricciones de la Limpieza :</a></h2>
              <!--[if lte IE 7]>
            <figure>
                <a href="#"><img src="images/thumbnail.jpg" alt="Post thumbnail" class="thumbnail alignleft" /></a>
            </figure>
            <![endif]-->
            <div class="entry-content">
                <p>
                     <br>» El programa funcionará únicamente para el tratamiento de archivos PDF.
                     <br>» La extracción y limpieza se realiza sólo en documentos escritos en idioma inglés o español.
                    <br>» El sistema no será funcional para los siguientes casos: 
                </p>

                <p>
                   a.- Cuando el tamaño del documento es muy extenso, aproximadamente más de 20 páginas.
                    <br>b.- Cuando en alguna parte del documento existe una página en blanco intermedia, 
                    la aplicación toma esta página en blanco como el final del documento.
                    
                </p>
                
                <p>
                   » El sistema toma el archivo PDF seleccionado y lo copia en una carpeta donde se encuentran los archivos del servidor en que esté corriendo el sistema, por lo cual es necesario que se cuente con la permisología adecuada poder copiar el archivo en el servidor y llevar a cabo la extracción.
                </p>
            </div> <!-- .entry-content -->        
        </article> <!-- .post 2 -->
            </div> <!-- .entry-content -->
            
        </article> <!-- .post 1 -->
        
        <hr /> <!-- Post seperator - Not the most optimal solution -->
       
    
    </div> <!-- #content -->
    
    
</div> <!-- #main -->
    
   
    
    <div class="clear"></div>

</div> <!-- #wrapper -->

</body>
</html>
